CNCC 2019 | 跨界深度对话,智能驾驶的未来落地与挑战
点击上方“蓝色字体”,选择“置顶公众号”
精彩内容,即刻送达
技术论坛现场
在论坛开始时,主持人王亮老师的一个小问题为论坛奠定了轻松、随和的基调。
Q1
在这次论坛之前我曾向台下的听众了解了一下,其实他们很多人都说非常期待这场圆桌讨论和台上四位嘉宾的思想碰撞。嘉宾们,你们预测一下听众们想问什么样的问题?
自动驾驶什么时候能实现?
韦峻青
査红彬
将来无人驾驶到底会成为什么样的状态?到底对大家的日常生活有什么帮助?
我觉得听众们希望了解像人类一样驾驶的自动驾驶技术什么时候能够实现?其实回答这个问题是比较难的,二十年前大家讲十年后可以实现,十年前讲还是十年后,今天讲恐怕还是十年后。汽车的自动驾驶技术一直在不断进步,但是预测技术什么时候完全成熟是一件十分困难的事情。
李升波
杨明
我希望问题不是自动驾驶哪家最强?
Q2
其实之前我自己也简单做了几个常规性的问题,因为自动驾驶这个问题提了很多年,国内外公司和学术界也做了很多年,但现状是最关心的,尤其是大环境下我们中国自动驾驶水平发展到什么地步?同时中国自动驾驶水平在世界上又占据什么样的地位?
杨明
中国和世界自动驾驶的对比,这个肯定是有差距,我们毫无疑问承认这一点,但是这个差距在快速缩小。2002年我印象中去参加智能车领域旗舰会议IEEE IV会议中国人只有5-6个人,现在每年参加这个会议中国人非常多。这说明中国在人才储备上面慢慢开始上来了,尤其是国家自然基金举办了智能车未来挑战比赛,不管是基础研究方面,还是工程实践方面都有了比较好的积累。
如果要比较中外差异,关键看工业界,在1997年做自动驾驶的时候,国内车厂很少有人关注这个领域。现在不光是车厂,还有互联网企业也非常关注这个行业,而且实力很强。刚才一直讨论激光雷达,1997年只有一种激光雷达,现在不管是禾赛、速腾、大疆,他们的激光雷达价格性能其实不比国外差了,尤其是大疆实实在在是自己的产品,这说明国内工业界实力已经上来了。
再有是政府,从全国各地自动驾驶测试基地就可以看得出来,这方面支持力度非常好,所以我觉得是快速赶超的过程,当然差距是有,但我相信会在比较快的时间内接近国外的水平,这是我个人的观点,谢谢。
谈到自动驾驶,首先要了解自动驾驶智能程度的分级,按照美国SAE标准分为五个级别,从低到高分别是驾驶辅助、部分自动驾驶、有条件自动驾驶、高度自动驾驶以及全自动驾驶。
目前,前两个级别,L1级,L2级的商业化前景已经很明朗了,但是再往上走L3,L4,商业化的难度还是比较大。实际生活中,一个新手驾驶员从开始学车到完全成熟大概需要一年半到两年时间,但是自动驾驶汽车的上路缺乏这么一个逐步适应和熟练的过程。业界现在的开发流程是自动驾驶功能设计好之后,马上应用到实际道路行驶,但是,让自动驾驶汽车在任何道路、任何环境都不出差错,怎么保证安全性和可靠性是非常具有挑战性的问题。
给大家分享一个数据:2014年美国统计了全国驾驶员发生事故的频率,统计结果是:每1亿英里事故数量大概是500余次,致命事故数量约20-30次。而结合自动驾驶汽车在美国加州的测试数据,经过我们核算之后,现有最好水平的自动驾驶汽车的人工干涉率为1亿英里1万次。如果大致认为一次人工干涉,就代表一次可能发生事故,这说明现有最好技术水平下的事故数仍然是驾驶员平均水平的20倍!再进一步考虑到现有的自动驾驶汽车多行驶于交通情况良好的高速公路,以及低密度交通的城市工况,它们在各类场景下实际的表现可能更加糟糕,这也说明类似人类水平的自动驾驶技术的研发,还是任重道远。
另外,把自动驾驶汽车与驾驶员的平均水平对比是否合理呢?驾驶员心理学上有一个有趣的悖论,称为“高于平均悖论”,即80%的驾驶员认为自己的驾驶水平是高于平均水平的,但我们都知道统计学上只有50%的驾驶员会高于平均水平。那么这个悖论说明什么问题呢?说明要想让一个自动驾驶系统超过驾驶员心理预期的平均水平,其技术水平不能只到人类的50%,而是要达到80%才行。
李升波
査红彬
我不是做自动驾驶的,从我报告当中讲的内容可以听出来,讲的内容跟自动驾驶有关系,但是本人并不直接做自动驾驶,所以我只能谈谈自己肤浅的看法。
国内和国外相比,现在企业界活力很强,企业里朝气蓬勃,有各种各样的科研项目,我觉得企业现在的势头是比较好的。
其实自动驾驶离不开产品,离不开测试,在国外当然也有很多国家或州政府制定了有关于政策与法规,但是在中国可以做国外可能做不了的测试,这些跟国外相比是有比较好的实验基础。另外一些新创企业将新的技术积极地推向市场,所以这几年产业界发展很快。
从高校来讲,我们国家起步应该也不算太晚,十几年前国家自然科学基金委启动的认知科学相关的重大研究计划中,将应用落地就放在自动驾驶上面,提出构建一个成果的集成与展示平台,这就是自动驾驶平台。十几年来,中国在基础研究领域,在高校,研究院所就开始做这样的研究和布局了。
现在和国外研究机构相比有没有问题呢?还是有问题,主要问题就在于,重复性工作做得还是比较多,但是创新的,需要新的思想方面的工作有所欠缺,这跟国内大环境也有关系。产业界和高校相比,高校起步要比企业要早,但是现在看起来企业在面向应用方面做得实际工作比高校影响力会更强一点。
今天特别荣幸到这儿,有一种回到十年前在清华上学的时候各位老师讲各种学术的观点的学术氛围,确实学习到很多东西。从我来讲,做自动驾驶不是因为它简单,而是因为它难,因为它有挑战且十分重要。这也是为什么这个领域大家都投身进去的原因。
接下来我想谈两点,第一点是人才,我们尽可能网罗全球顶级的人才,现在国内很多核心工程师都是从美国高薪挖过来的,希望在中国办好这件事情。所以中美之间的人才差距在很快地弥补。
在中国,为什么人才愿意进入滴滴这样的企业做这个事情呢,实际上还是基于场景,并且中国的潜力也很大。从行业研究来讲,十年以后移动出行市场占全球70%,并且我们的人口也多,所以从这个角度来说没有理由不出现顶级的自动驾驶企业。
我之前在国外工作做自动驾驶,回国后有一个方向我觉得肯定要做,但是跟国外走不一样到道路的就是车路协同。国外做的时候,大家从来不讨论这个,但是在国内5G,车路协同网络铺设的真的是非常非常快,这会大大降低自动驾驶整个难度。另外我们也会循序渐进,从低速开始做,再慢慢的扩展我们的商业化,所以我觉得差距缩小得很快,我相信5-10年中国会出现顶尖的自动驾驶企业,滴滴也希望成为其中之一,自动驾驶技术将跟着滴滴的国际化走向国外。
韦峻青
Q3
四位嘉宾承认国内自动驾驶跟国外相比是有差距的,当然也充满信心未来会缩短这个差距。
第二个问题,前一段时间有一个知名机构从不同的维度对当前自动驾驶公司做了一个排名,排名中比较有意思的现象,第一名和倒数第一名这两个都是知名的公司,一个是Waymo,一个是Tesla。这两家公司采用的传感技术并不完全一样,有的采用激光雷达,有的采用视觉技术。基于这个排名,并根据你们对Tesla或者Waymo公司了解,无人驾驶汽车技术路线到底是采用激光雷达比较好,还是计算机视觉比较好,还是有其他的途径?
韦峻青谈滴滴在智能驾驶安全保障的探索与实践
韦峻青
我觉得激光雷达是先应用落地的,当然如果最后算力,视觉传感器真的足够好的话,相信Tesla解决方案也是能做出来的,它也将是基于巨大量数据的。
我也非常赞同几位专家的看法,两家公司的产品定位一个是低级别辅助驾驶,一个是高级别自动驾驶。个人观点是两者都是合理的,面向高速公路场景中的自动跟车和车道保持功能,Tesla采用一个或多个前向摄像头加上毫米波雷达,车身周围再布上超声波雷达,是低级别驾驶辅助系统十分合理的选择。
李升波
杨明
目前Tesla做得这个我觉得是辅助驾驶,不是自动驾驶,所以不存在这个问题。
其实我的想法有一个比较大的转变。我自己最初是做激光雷达数据处理的,所以自动驾驶出来的时候,我就认为利用激光技术是最关键的。这么些年过来之后,我反而认为,如果从成本和实用的角度看,从处理实时性角度来考虑,还有与生物感知机理相比较,基于视觉方法是不是更有优势?当然激光能起到很好的辅助作用,但是从理想角度来看,我自己期待未来将来更多的自动驾驶系统是基于视觉方式的。
我觉得,对于自动驾驶来说,感知问题是不是伪命题?现在在自动驾驶里面所费的精力都在感知技术上面,但是感知是解决最后一公里的问题。自动驾驶更多的是车辆和道路之间的关系,是车辆和车辆之间的关系,是基础设施建设的问题。很多时候不需要任何传感器都能完成在主干线上自动驾驶,只不过从主干线下来,在有人的地方,有车的地方,更复杂的环境下怎么回到家,需要更为强大的感知能力。
查红彬
Q4
大家对这个问题有不同的意见,激光雷达和视觉各有各的特点。
第三个问题,大家都知道当前人工智能技术发展得比较火爆,这个过程中深度学习起到了不可磨灭的重要作用。但是深度学习是大数据的学习模型,依赖于很多样本和真实的数据。同时深度学习也有一些缺陷,有不确定性或者不可解释性,这些性质在某些方面对于系统模型存在来说有不稳定和不安全感,那么依赖数据的深度学习模型对无人驾驶来讲,会带来很多挑战的问题,大家也听说过不同的实例,比如说Tesla撞白云,Waymo出车祸。
那么当前自动驾驶技术尤其是采用这些深度学习模型做一些解决方案的技术,通过它们我们该如何提升交通安全和保障乘客安全性认知?
李升波老师回答海量数据给智能驾驶带来的机会和挑战
我继续抛砖引玉吧,深度学习在滴滴整个系统里是大量应用的,尤其是感知系统。我们确实也发现了一些问题,现在对整体系统架构的看法是深度学习为主,车可能99点后面多个9的时间都可用深度学习方法做很多决策和感知,但是也要有一套非常传统的过车规ISO的方法,相当于大部分时间都用深度学习,但是最底下紧急停车模块是要通过车规解决的,需要依据多种传统的方法,比如硬件软件来保证最基本的安全性。当然我们相信它能处理绝大部分问题,我们也有方法保证它的安全性,这是从架构上第一天就有的一个设计。
韦峻青
査红彬
这个问题要分两个不同的层面来看。对于自动驾驶来说,机器学习肯定是有用的,在很多环节都会有用。但是机器学习是不是深度学习就不一定。现在深度学习最好的应用是在哪呢?在人脸识别,文字识别等方面,它能解决的大多是静态对象,对于动态的时间序列数据,深度学习的表现不是很尽如人意。我个人觉得将来一段时间之内,我们要解决的计算机视觉最核心的问题就是动态视觉,也就是自动驾驶的一个场景。
回答这个问题十分困难,我们不妨看看驾驶员自己,这是地球四十亿年生命进化的最高水平,也是我们唯一可借鉴的、最成功的智能生命体。从仿生学的观点看,人类大脑约有1000亿个神经元,功耗在8-10瓦,这就是人类开车的算力。狗的神经元大概有50亿个,很多狗也是可以简单开车的,但是我们很难想象青蛙和鱼能够开车,它们大概只有1千万个神经元。所以,我们的一个判断是在百亿神经元的规模下,人工智能可以达到像人类驾驶员一样的开车水平。
前段时间看到一则报道:英伟达训练了一个BERT神经网络,具有83亿个参数,我估计差不多是1亿到10亿个神经元,但是需要512片GPU组成的服务器进行训练和前向推断,估计所需的功率大概在10万瓦左右。但是,一般来说自动驾驶汽车对系统功耗的要求仅在150瓦之下,可见目前的车载计算能力还是远远不够,怎么提高自动驾驶控制器的算力,怎么让自动驾驶算法的规模变得更大,这是解决问题的关键。当然还有神经网络的不可解释性和安全性问题。这些问题最终都是要通过算法和算力的协同设计,或者软件与硬件的协同设计,进一步逐一解决,最终将自动驾驶汽车的智能化水平提升到人类水平。
李升波
杨明
从偏工程的角度来讨论这个问题,用不用深度学习或者用机器学习,很多时候我们判断依据是有没有数据,有没有这个算力?如果有才会考虑,如果没有,先用最传统的方法把问题解决。
Q5
主持人:当前自动驾驶确实有很多挑战性问题。将来用智能驾驶技术如何提升安全保障,让大家放心去坐,这个方案这可能还需要很长的时间去解决。第四个问题,数据对自动驾驶来讲是非常重要的,而中国在这方面场景非常复杂。同时,我们国家相对于其他国家的地域差别是客观存在的。一方面对普遍性自动驾驶技术提出了挑战。另一方面这种场景差异在研发自动驾驶技术中成为技术竞争中比较好的一个优势,可能对于提升性能鲁棒性方面是积极的。有人开玩笑说,如果有人解决中国交通场景中的问题,那其他国家交通场景就显得不那么难了。
査红彬老师表达对当前智能驾驶不同技术路线的看法
我用一个小的例子来回答。昨天晚上我的一个硕士生论文开题,他的研究方向多车汇流,一般传统方法比较保守,到汇流的时候不一定汇流进去。所以他的解决方案是采用博弈方法。问题是新的交通法规出来了,汇流的时候必须是一对一逐个插入,如果没有按照这个标准插入,至少在上海摄像头抓拍下来是要扣分的,这样就导致他所采取的策略可能是违法策略,这个不仅在中国,我也相信交通法规也在不断优化和变化过程当中,对自动驾驶方面本身也存在法理伦理的问题,这个问题也需要我们大家共同来思考。
杨明
李升波
中国的道路交通场景是十分复杂的,比如北京的五道口,我们在清华戏称五道口为“宇宙中心”,其交通复杂性可想而知。我认为能够解决中国交通场景的智能驾驶技术,一定是世界上最先进的技术。但怎么解决这个问题,其实难度是比较大的,一类主流的解决方案是累积大量数据,把数据打上标签,再去训练某一个模型,或者感知、或者决策、或者控制,最后将这些模型部署到自动驾驶汽车上。这个思路的一个问题是如何累计足够多的数据呢?有人质疑说,人工智能其实是“人力”智能,有多少人力就有多少智能,因为它主要是靠大量的人力通过打标签实现的。我个人认为:在自动驾驶领域,这个人工智能开发模式很难持续走下去,至少不能达到类人的自动驾驶功能。主要是两个原因:
一个原因是数据打标签的成本太高了。斯坦福大学的李飞飞教授曾经主导过一个机器视觉图库项目,为1500万张图片打标签,该项目前后用了两年时间,全世界5万多工作者参与才完成这一项任务。这还只是一个二维视觉图库的项目,延伸到自动驾驶领域,其对打标签的需求量更高,对打标签的质量要求也特别高,因为激光雷达,摄像头,毫米波雷达等传感器和传感器之间的数据存在关联标注的问题。从这个角度来讲,自动驾驶的大数据是难以想象的海量数据,怎么突破数据打标签这个局限,其实是各个公司需要考虑的问题。
第二个原因是驾驶过程具有典型的长尾效应。按照人类的驾驶行为模式看,95%的数据处于少量的十几个驾驶模式之内,比如说跟车、换道、超车、自由直行、左转、右转、掉头等,但是人类大概具有上百种驾驶行为模式,多数行为模式的数据量很少,而这些数据稀少的行为模式又与行车安全性密切相关,所以说人类的驾驶数据集是一个样本极其不均匀,但是类别特别繁多的数据库,这对自动驾驶决策智能的开发是十分不利的。
如果在自动驾驶过程中或者有人驾驶过程中,主动筛选所需的少样本数据,并将数据标记的工作自动完成,就有可能解决前面提到的两个问题,现在已经有一些大学在做类似的工作。总而言之,设计一个类似人类驾驶员的自动驾驶系统,这个事情是非常具有挑战性的。
我觉得在中国和美国肯定不一样,但是整个架构应该是没有太大变化,各个地方的决策树其实是可以统一的,当然在中国不确定性更大一点,这也是由于数据驱动的。在中国,这个架构是各地通用的,那么也会对其他风险路有一定的参考意义。
韦峻青
Q
各位嘉宾的观点大家都了解了,自动驾驶今日的繁荣其实是需要不同行业的基础共同构建。接下来我们把问题留给听众,大家有什么问题可以踊跃地举手。
现场观众连连发问
提问:今天下午学习到了很多知识,我想问一个问题,构建地图如果四周参照物或者标注不大,比如说四周根本没有什么标注,在很空旷的环境里面,该怎么构建呢?
我们在解决这个问题首先考虑到传感器看得比较远,就是200米。200米之内目标比较少,另外我们还有其他的雷达。完全没有特征情况比较少,但也出现过这种情况。
韦峻青
査红彬
如果在周围环境当中没有明显的特征,那么构建地图确实很难。但是也不是没有办法,对于三维空间的SLAM问题来说,定位与建图是一个动态的完整过程,你可能会从地图中发现一些其他地方存在的、全局性结构,它们能帮助你构建地图。也就是说在一些没有特征的地方,你可能会在另外一些时空相关的地方找到有用的特征。
各位好,我想问一个问题,今天聊到智能驾驶不确定性,今年车市非常低迷,跟业内人士聊的时候,他们说今年车厂高管非常轻松,因为往年干不好怪自己,今年干不好就怪大环境了,我想问一下车市的动荡会不会对自动驾驶的研究带来一些影响。
汽车市场最直接的影响是项目经费的缩减,国内人工智能研究的热度大概从2014年开始,上升期经历了2015、2016、2017三年,到2018年达到高潮,现在有一些放缓的态势。今年汽车销量坦白说不是特别好,不少汽车企业面临的压力也比较大,有一定可能性会推后新型驾驶辅助系统的上市计划。市场需求对自动驾驶研究项目的启动与推进影响还是挺大的,这一点需要持续关注。
李升波
我想问一下从计算机视觉角度来说做自动驾驶的主要难点是什么,以及现在的解决方案?
从我的观点来看,论文选题要来自于实际,但并不一定非要把这个问题解决掉,解决掉并不是论文的目标。从论文选题角度,我建议更多是从培养创新性角度选择题目,从这个角度来说,不用考虑太多太复杂的工程上的问题,更多从创新角度考虑,这是我个人的观点。
杨明
査红彬
你目前所做的工作以自动驾驶为背景,打算应用计算机视觉方法来解决具体问题,这是一个非常好的方向。前面我也提到过,计算机视觉以前更多解决的是静态问题,将来计算机视觉重点肯定放在动态问题上,就是传感器在动,对象在动。在这种具有复杂变化的状况中,怎样提高视觉处理的性能,这里面肯定是有很多事情可做。
C
非常感谢四位嘉宾的分享,也感谢听众朋友们的关注。这场会谈让我们受益匪浅。
会后嘉宾合影
注* 本文根据现场记录整理,可能有部分不够完整、准确之处,敬请指正。
CNCC 2019 | 滴滴CTO张博宣布开放城市交通指数数据集 助力交通领域科研发展
编辑 | 贺贺